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基于 特征 重 标定 生成 对 抗 网 络 的 图 像 分 类 算法 
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摘 要 : 针对 传统 鉴别 器 的 损失 策略 和 结构 难以 提取 到 更 抽象 以 及 任务 相关 的 鲁 棒 性 特征 ， 从 而 导致 半 监 督 图 像 分 
类 表现 不 足 ， 提 出 了 基于 特征 重 标定 的 生成 对 抗 网 络 。 为 了 学 习 到 任务 相关 的 特征 ， 在 现 有 半 监 督 GAN 的 基础 上 ， 
为 鉴别 器 引入 模型 在 不 同 状 态 下 的 无 监督 均 方 差 损失 正则 项 ， 对 训练 样本 中 两 个 分 支 的 同一 输入 对 应 得 到 的 不 同 输 
出 进行 参数 惩罚 ， 从 而 指导 特征 重 标定 的 优化 方向 。 此 外 ， 在 鉴别 器 中 加 入 压缩 激活 模块 来 优化 传统 鉴别 器 的 卷 积 
池 化 结构 。 该 模块 自动 学 习 每 一 个 特征 通道 的 重要 程度 ， 能 够 提取 任务 相关 的 特征 抑制 任务 无 关 的 特征 ， 实 现 特征 
的 重 标定 功能 ， 从 而 提高 半 监 督 图 像 分 类 的 表现 。 
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Abstract: In view of the loss strategy and structure of traditional discriminator is difficult to extract more Abstract: and 

《 二 task related robustness features, which leads to the shortage of semi supervised image classification, and proposes a 
generation countermeasure network based on feature re calibration. In order to learn the related features of the task, on the 
basis of the existing semi supervised GAN, the unsupervised canonical loss regular term of the model under different states 

is introduced to the discriminator, and the different output of the same input corresponding to the two branches of the 

training sample is punished to guide the optimization direction of the feature re calibration. In addition, the compression 


activation module is added to the discriminator to optimize the convolution pool structure of the traditional discriminator. 


The module automatically learns the importance of each characteristic channel, and can extract the features related to the 
task to suppress the unrelated features of the task, and realize the recalibration function of the feature, thus improving the 
performance of the semi supervised image classification. 
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0 引言 分 类 器 的 预测 结果 作为 缺失 的 标签 。 Rasmus 等 向 提 出 了 基于 
n 自动 编码 器 的 阶梯 网 络 (ladder network) ， 编 码 网 络 用 于 监 
像 分 类 是 计算 机 视觉 中 最 为 主要 的 任务 之 一 ， 而 半 监 ”督学 习 ， 解 码 网 络 的 每 一 层 与 编码 器 相对 应 ， 用 于 无 监督 学 
督 图 像 分 类 算法 能 够 在 有 限 带 标签 样本 的 前 提 下 较 好 地 解决 习 训 练 ， 形 成 阶梯 ， 将 每 一 层 的 重 构 损 失 作为 总 的 损失 函数 
分 类 性 能 不 足 的 问题 。 这 几 年 卷 积 神经 网 络 CCNNO 对 图 像 ”来 指导 参数 优化 的 方向 。Laine 等 人 喇 提 出 简单 高 效 的 深度 神 
的 特征 提取 使 得 视觉 任务 达到 了 一 个 新 的 高 度 。 其 中 Kin 经 模型 (可 -model 和 Temporal ensembing model) ， 借 览 自 
等 人 山 提 出 了 灵活 且 可 伸缩 的 深度 生成 网 络 算法 ， 采 用 丰富 学 习 思 想 ， 将 无 标签 数据 样本 的 预测 结果 来 指导 模型 参数 的 
的 参数 密度 估计 来 建 模 以 及 变 分 推理 方式 来 训练 ， 包 括 隐 含 ”优化 方向 ， 即 在 不 同 数据 扩展 的 条 件 下 为 监督 损失 引入 了 无 
特征 判别 模型 (M1) 和 生成 半 监 督 模型 (M2), URES ”监督 正则 项 ， 模 型 在 半 监 督 图 像 分 类 中 取得 较 好 的 效果 。 
而 成 的 半 监 督 模型 (M1+M2 ) ,该 模型 取得 较 好 的 分 类 表现 。 GAN 神经 网 络 模型 ， 在 半 监 督学 习 上 有 着 良好 的 表现 。 
Maalge 等 人 叫 对 深度 生成 网 络 模型 进行 了 扩展 ， 提 出 了 辅助 Miyato 等 人 名 提出 了 一 种 基于 虚拟 对 抗 训练 CVATO 的 正则 
深度 生成 网 络 CADGMDO ， 通过 引入 辅助 的 隐 变 量 ， 改 进 变 ”化 方法 :局 部 分 布 平滑 LDS) . Salimans 等 人 中 通过 一 些 技 
分 近似 算法 ， 使 得 变 分 近似 更 加 具有 表现 力 。Li 等 人 中 提出 ” 巧 改善 了 常规 GAN 的 性 能 ， 将 鉴别 器 的 二 分 类 的 概率 输出 
了 一 种 最 大 间隔 的 深度 生成 模型 (MMDGM) ， 在 保留 强大 扩展 到 多 类 别 概 率 输出 ， 即 总 类 别 为 真实 样本 所 属 类 别 加 生 
的 生成 能 力 的 同时 ， 提 高 生成 模型 的 预测 性 能 ， 将 一 个 边缘 ”成 样本 类 别 ， 从 而 实现 预测 。Springenberg 等 人 [四 提出 也 


78 


N 


ga 
3 
& 


收 稿 日 期 : 2018-08-06; 修 回 日 期 : 2018-09-28 ”基金 项 目 : 国家 自然 科学 基金 资助 项 目 〈61379100) ; 江苏 省 高 等 学 校 自然 科学 研究 重大 项 目 
(18KJA520012) ; 徐州 市 科技 计划 项 目 基金 资助 (KC16SQ178) 

作者 简介 : 姜 代 红 (1969-) ， 女 ， 江 苏 徐州 人 人， 教授， 博士 ， 主 要 研究 方向 为 图 像 处 理 、 智 能 计算 (daihongjiang@163.com) ; 张 三 友 (1989-) , 
男 ， 江 西 萍 乡 人 ， 博 士 研究 生 ， 主 要 研究 方向 为 视频 警 务 、 智 能 计算 ; 刘 其 开 (1992-) ， 男 ， 江 苏 徐州 人 ， 硕 士 ， 主 要 研究 方向 为 深度 学 习 、 计 算 机 视 


:201901.00008v1 


chinaXiv 


录用 定稿 


Cat-GAN 在 鉴别 器 中 引进 


与 对 应 预测 类 别 的 互信 息 ， 通 过 最 小 化 真实 数据 样本 


FAF XAA AKA 


255 


习 到 


learn 


提高 分 类 器 的 表现 。 
引入 额外 的 分 类 器 ， 改 善 了 GAN 在 
和 鉴别 器 在 训练 时 无 法 同时 达到 最 人 
样本 的 语义 特征 。 
ing (ALI) 推 到 
据 空间 中 的 训练 档 


ERAKIRI 
Li 等 人 中 提出 了 triple 


监督 学 习 


上 的 


二 


的 
来 训练 分 类 
GAN， 通 过 


Inu 
E 


pus 
生成 器 


模型 ， 该 模型 引入 一 个 推理 


EL 
变量 


允许 


的 


基 合 分 布 ; 1 


本 映射 
T 生 成 器 输 昌 


模型 的 深度 及 空间 多 
Ej, Jaderberg 等 人 


11]y 


在 网 络 中 对 数据 进行 空间 


在 空 
性 


eu 
H6» 


特征 


通道 也 是 一 个 重要 


间 上 进行 特征 映射 。 除 了 在 空间 维 


| 到 隐 变 量 空间 ， 输 出 jj 


H 隐 变量 与 生成 样本 的 


度 是 提升 CNN 的 性 能 两 个 
/ Attention Lf! 
操作 ， 使 神经 网 络 能 够 


的 问题 且 生 成 器 


Dumoulin 等 人 09 提 出 


能 够 学 


adversarially 


器 。 


它 将 数 


| 练 样 


1 引入 到 空间 维 


E p 


本 与 隐 
Ka 


重要 方 


HL, 


Hr 


-能 够 提升 


AX. 


用 的 


H ri 
PE G 


在 不 


TAE, j 


ILI 


压缩 激活 模块 (squeeze-and-excitation 
块 可 以 显 式 地 构建 特 和 


[EE EAS CX 
因此 ,为 了 提高 模型 的 泛 化 能 力 以 及 


FE 通道 之 间 的 相 


了 


同 输 


于 特征 


重 标 定 的 生成 对 


的 突破 点 ，Hu SE AUI 
networks, SENet). 
互 依赖 关系 ， 提 取出 有 
的 特征 。 


基 | 抗 网 络 ， 为 鉴别 器 引入 模型 
同 状态 下 的 无 监督 均 方差 损失 ， 对 同一 输入 所 预测 的 不 
出 进行 参数 惩罚 。 与 此 同时 


模块 


1 


器 的 


维度 为 1024X16 的 高 维 空 | 
1024 、 大 小 为 4X4 的 特征 图 ， 


， 自 动 学 习 每 一 个 特 
定 操作 ， 从 而 提高 


基于 特征 重 标 定 的 生成 对 抗 网 络 结构 


车 于 特征 


标定 的 和 9 


输入 是 维 


E 度 为 100 


的 随机 


a 


成 对 抗 网 络 结构 如 医 
LRE =z, 
司 ， 然 后 重新 调整 到 通道 数 为 
的 反 卷 积 


经 


pa 


1 所 示 
, 首先 


zeERio 


过 若干 层 


主动 地 
网 络 的 
是 出 了 
该 模 


监督 分 类 的 表现 ， 


， 在 鉴别 器 中 加 入 了 SENet 
通道 的 重要 程度 ， 进 行 特征 
监督 学 习 表 现 。 


重 标 


， 生 成 
映射 到 


Cdeconvolutional network, DN) 运算 ， 每 一 次 反 卷 积 操作 特 


征 图 
的 生 


像 的 


DN Æ 
JTTA RRA, E IJ a a SAOR 8868 B 


的 大 小 变 为 原来 的 两 倍 ， 最 终 得 到 与 输入 图 像 尺 寸 相 同 


中 低 


ERER. 


本 质 上 学 习 输 


Zeiler 等 人 13 提出 的 一 种 中 低 


入 图 像 潜在 空间 的 特征 


层 特 征 


图 


和 卷 积 核对 应 的 映射 矩阵 ， 然 后 通过 学 习 到 的 卷 积 核 重 构 出 


输入 


网 络 , 其 本 质 是 进行 
防止 过 拟 合 ， 使 用 
得 到 总 的 损失 。 

2 


图 像 。 


鉴别 器 的 输入 有 
为 无 标签 样本 和 


和 无 监督 均 方差 损失 。 
化 操作 之 后 ， 得 到 一 


生成 村 


TPR 


的 带 标签 相 


层 特 征 图 U 


一 个 SENet 模块 对 特征 进行 标定 ， 得 到 重 标 定 


其 中 对 = G(z) 。 为 了 增加 


fF 本 和 真实 样本 ， 
fF 本 。 带 标签 样本 仅 参 
器 的 监督 损失 ， 无 标签 样本 和 生成 样本 参与 无 监督 对 


真实 样本 


网 络 的 非 线 怕 
个 1X1 的 卷 积 ,为 了 减少 模型 的 参数 ， 
全 局 平均 池 化 来 代替 全 连接 


随 


中 主要 
IA 别 


与 鉴 另 
抗 损失 


首先 输入 样本 通过 若干 个 的 卷 积 与 池 
其 中 U eRov , 


后 紧 接 


的 特征 图 


U', 


E 拟 合 能 力 ， 引 入 NIN 
屋 ， 最 


终 加 权 


基于 特征 重 标定 生成 对 抗 网 络 的 图 像 分 类 算法 


本 文 主要 是 从 模型 的 集成 思 


Ie. 


于 特征 重 标定 的 生成 对 抗 


网 


络 模型 dropout 正则 项 以 及 随机 噪声 的 存在 ， 
本 相同 ， 但 也 会 导致 网 络 输出 
此 选 代 次 数 中 ， 对 同一 数据 进行 


3X 


训练 阶段 且 输 入 村 
。 因 此 ， 在 同一 个 


想 和 模型 的 结构 出 发 ， 搭 建 
?&. ŒV 1 


| 练 过 程 中 ， 


于 网 


尽管 在 


同一 个 
发 生 改 
随机 处 


会 发 生变 化 。 为 了 指导 模型 参数 优化 的 方向 ， 


希望 同一 个 输入 得 到 的 输出 
归属 的 某 一 类 的 概率 


ChinaXiv 合 作 期 刊 


ARH, Ei 基于 特征 重 标定 生成 对 抗 网 络 的 图 像 分 类 算法 


适当 的 目标 函数 来 权衡 输入 样本 


第 37 卷 第 3 期 


尽 可 能 相同 , 即 对 预测 分 类 而 言 ， 
尽 可 能 相近 。 


100 维 
Bt pl 
声 变 

z 


2.1 


别 器 的 


图 1 


算法 原理 
假设 X 700,28, x") 表示 m 个 真 
示 维 度 为 100 的 随机 
输出 代表 其 


LRE H, 


输入 样本 


FR-GAN 的 框架 结构 
Fig. 1 Frame structure of FR-GAN 


则 常规 GAN 总 的 目标 函数 表示 为 


min max E, x[log(pCy 21| x, D] + E... loga — pCy =1] x, D))] 


的 ,不 


带 标签 的 输入 样本 对 标签 类 另 


KP 
€-GG) 表示 生成 样本 ， 则 鉴 
属于 真实 样本 的 概率 ， 表 示 为 


pO =1|x, D) = zr 


Tee DO 


# 本 的 集合 ， zeR X 


(1) 


Q) 


生成 对 抗 网 络 的 半 监 督学 习 主 要 是 通过 鉴别 器 来 实现 


仅 要 考虑 到 输入 样本 属于 真实 样本 的 概率 ， 还 要 考虑 


的 概率 。 


假设 给 定 标签 类 别 共 


有 K 类 ， 样 本 < 经 过 特征 提取 得 到 


个 K 维 的 特征 向 量 


类 的 概率 表示 为 


3) 


logits={4,4,…lx} ， 则 该 样本 对 第 j 
ce Lo exp) 
Poode V 7 J | x)= X5 een 
在 监督 学 习 算 法 中 ， 


Im 


假设 鉴 


本 ， 则 


别 的 训练 样本 


78 FI HIRE RAE ISE SCR 
输入 到 鉴别 器 的 生成 样本 所 属 的 类 别 定义 为 第 K+ 类 , 则 来 
aD =K +1, BIMF 1- DO), 


生成 样本 的 概率 表示 为 Pro 


为 了 获得 


半 来 


实 样 本 ， 另 一 半 来 自生 成 样 
半 监督 生成 对 抗 网 络 鉴 别 器 D 的 损失 函数 可 表示 为 


目标 函数 就 是 最 小 化 样本 标签 与 模 


GAN 的 监督 损失 ， 将 


L- by [log Pmoaer (Y | x)]- E..cllog Prosa (Y =K +1 | x) 


=Lup aiad 十 Lys. ervised 


à 


D(X)=1- paa (Y =K +1|x) , 则 


Lnsuperised 7 — Es-p,, c9 log — D(x))] - E...,,,,, log(1 - D(GC2))] 


EL FH: 


PR-GAN 针对 


同 状态 


D(X)= 


Zo) 9 


Zo) 


ZG) 2 Y, expli G)] 。 


监督 分 类 任务 ， 为 鉴别 器 引入 模型 在 不 


下 的 


C IECUR I 


-4E SH 
惩罚 , 


(4) 


带 标 签 的 训练 样本 贡献 于 监督 损失 为 
Lpervised = Eu log Pasa Y | xy«K«0)] 


无 标签 训练 样本 贡献 于 无 监督 对 抗 损 失 。 


(5) 


^ 


(6) 


F 均 方差 损失 ， 对 真实 样本 两 个 分 支 的 
同一 输入 而 得 到 的 不 同 输出 进行 


该 正则 项 能 够 学 习 任 


务 相 关 的 特征 , 提高 半 监 督 分 类 的 精度 。 假 设立 ={, 庆 … 训 } 表 
示 的 是 第 二 分 支 无 标签 的 训练 样本 ， DG) 表示 的 是 鉴别 器 同 
一 训练 阶段 下 的 不 同 状态 ， 通 过 随机 预 处 理 函 数 O 得 到 输 
入 对 应 的 输出 为 

ZO = ÕS EO) (7) 

同 理 第 一 分 支 下 的 输入 对 应 的 输出 为 

z0=Do(CFCO)) (8) 

则 无 监督 特征 均 方差 正则 项 表示 如 下 : 


201901.00008v1 


chinaXiv 


姜 代 红 ， 等 : 


ja " 
loss, = wo z - £l (9) 


其 中 : wO 表示 的 是 在 训练 过 程 中 正则 项 对 鉴别 器 贡献 是 动 

态 的 ， 训 练 初期 ， 由 于 网 络 参数 较 差 ， 该 正则 项 的 贡献 为 0， 
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图 2 SENet 模块 结构 
Fig.2 Structure of senet Model 
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a) 压缩 F,CO 操作 : 为 了 探索 特征 通道 相互 之 间 的 依赖 
性 ， 首 先 考虑 学 习 特 征 图 中 每 一 个 通道 的 信息 。 由 于 卷 积 核 
是 在 一 个 局 部 感受 野 进行 操作 ， 因 此 ， 卷 积 变换 之 后 得 到 的 
节点 都 无 法 获取 该 局 部 感受 野 以 外 的 信息 。 压 缩 操作 将 全 局 
空间 信息 压缩 到 一 个 通道 描述 符 中 ， 通 过 全 局 平均 池 化 来 生 
成 描述 特征 通道 信息 的 统计 量 z ， 统 计量 的 第 c 个 元 素 计算 
方式 如 下 : 


A 


PD (10) 
此 中 ; ze Re ， 代 表 着 整个 图 像 的 信息 。 
b) 激活 09 操作 ， 它 是 一 个 类 似 于 循环 神经 网 络 中 门 


的 机 制 。 由 两 个 全 连接 层 组 成 ， 将 特征 维度 降低 到 输入 的 
1/16, 然后 经 过 ReLu 激活 后 , 通过 一 个 全 连接 层 升 到 原来 的 
维度 ， 最 后 通过 一 个 Sigmoid 的 门 获得 0-1 之 间 归 一 化 的 权 
重 。 具 体 表 达 式 如 下 : 


s = F„(z2,W) = o(8(z,W)) = o(W,8(W,2)) (11) 
其 中 : 5 是 指 ReLu 激活 函数 , o 是 指 Sigmoid 函数 ,Ww eR” 
W eR” 。 参 数 W 用 来 显 式 地 建 模特 征 通道 间 的 相关 性 。 


c) EPRE FAO BRE: oo 
征 选择 之 后 的 特征 通道 的 重要 性 指标 ， 然 后 与 之 前 的 通道 


个 加 权 相 乘 ， 完 成 在 通道 维度 上 的 对 原始 特征 的 重 标定 。 
第 c 个 特征 通道 的 加 权 公 式 如 下 : 

& = Fans) su. (12) 
其 中 X-[X. X5. x], S-[5.55555]. 


2.2 — 
基于 特征 重 标定 的 生成 对 抗 网 络 半 监 督 分 类 算法 流程 如 
下 所 示 ， jo 表示 输入 数据 随机 预 处 理 函 数 ; 工 表示 带 标签 
的 数据 集合 ;B 表示 每 一 个 批 大 小 Batchsize 组 成 的 数据 集合 ; 
wO 表示 无 监督 权重 的 动态 时 间隙 数 ， 用 Xavier 方法 进行 参 
数 初始 化 。 

初始 化 : 批 大 小 Batchsize: m=1686， 即 每 一 次 参数 更 新 时 所 需 的 样 

本 数 ， iterations: 批 迁 代 次 数 ， 遍 历 一 次 训练 集 所 需 m 的 个 数 ， 

即 总 的 样本 数 除 以 m 的 值 ; epoch: 一 个 epoch 等 于 遍历 训练 集 一 次 。 


基于 特征 重 标 定 生成 对 抗 网 络 的 图 像 分 类 算法 
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设 超 参数 k=1， 即 训练 鉴别 器 次 才 训 练 生成 器 1 次 ;噪声 样本 为 服 
JA z ~ U[-L1] 的 100 维 向 量 。 


for number of training iterations do 


for k steps do 

抽样 m 个 噪声 样本 { z0 ，z2 em zm) 
抽样 个 数据 样本 { x a eee am ) 
计算 鉴别 器 的 对 抗 损失 : 


loss, = -+$ s D(x'?) -log(1 - D(G(z)))] 


i=l 


- 算 不 同 随机 状态 下 鉴别 器 对 真实 样本 的 输 昌 
zeB«c—D,(f(x eB) 

Z; € B 4 Ď,(f (x; eB) 

计算 鉴别 器 的 监督 损失 和 无 监督 损失 


ue 
EE 


lossiapel 三 一 


1 T " 
[5j eels Dip Mar LS plk- 根据 损失 计算 


鉴别 器 的 梯 
grad(0,) = V O,|loss,,, + lossu4] 
根据 梯度 更 新 鉴别 器 的 参数 : 
0,=Adam(grad0,,0,) 


i 


end for 
抽样 m 个 噪声 样本 { z0 , zo m z™ } 
计算 生成 器 的 对 数 损失 
loss, = E... log[-D(G(z))] 
根据 损失 计算 梯度 并 更 新 生成 器 的 参数 : 
grad (0,) = V 0, |loss,,,] 


0, -Adam(grad 8, ,0, ) 


end for 
3 ”实验 结果 及 分 析 


本 章 实验 选取 了 SVHNM4I 数 据 集 进行 实验 验证 。 实 验 是 
在 Theano05 深 度 学 习 框 架 上 实现 ， 在 单 块 GPU 型 号 为 
GTX1080 上 运行 .本 实验 的 生成 器 以 DCGAN 生成 器 为 基准 ， 
鉴别 器 引入 SENet 模块 来 增加 模型 的 非 线性 。 初 始 学 习 率 设 
为 0.0003， 模 型 中 同样 使 用 WN, BN 以 及 dropout 策略 。 关 
于 网 络 模型 的 参数 配置 如 表 1 所 示 。 
表 1 SVHN 数据 集 的 网 络 参数 配置 
Network parameter configuration of the SVHN data set 
鉴别 器 D 生成 器 G 


Table 1 


输入 32X32 三 通道 类 标签 yeR" 输入 Noise e R% 
D t=0.2 MLP 8192 units 
ropout-Ü. 
ReLU, BN 
3X3 conv, 64, IReLU, WN "s nar 
eshape 
3X3 conv, 64, IReLU, WN p i 
3x3 cx dpa wap. 0004806 0 mde g 
conv, 64, IReLU, 
ReLU, BN 


Dropout-0.2 
3X3conv, 128, IReLU, WN 
3X3 conv, 128, IReLU, WN 
3X3conv, 128, IReLU, WN 

SENet block 

Dropout-0.2 
3X3 conv, 256, IReLU, WN 

NIN, 128, IReLU, WN 
NIN, 128, IReLU, WN 
Global pool layer 
Denselayer 10 Units with WN 


5X5 deconv, 128, stride 2 
ReLU, BN 


5X5 deconv, 3, stride 2, 
Tanh, WN 
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度 


FR-GAN 与 无 SENet 模块 仅 


对 


为 了 对 比 加 入 模块 前 后 的 生成 样本 质量 和 半 监 督 分 类 精 
， 保 证 其 他 模型 的 配置 相同 。 在 生成 样本 的 质量 方面 ， 
正则 项 的 GAN 作 比 较 ， 视 觉 
比 结果 如 图 3 所 示 。 使 用 ISIGnception Score) 指 标 进行 定 


量 对 比 ， 对 比 结果 如 表 2 所 示 。 


正则 项 GAN 本 文 GAN 
Real sample GAN with regular term FR-GAN 


图 3 SVHN 数据 集 上 生成 样本 对 比 图 
Fig.3 Comparison of Generative Images in SVHN Datasets 
表 2 不 同 模型 生成 样本 的 初始 得 分 


Table 2 Initial scores of samples generated by different models 


GAN without 


, 32$ GAN without regular 
方法 ”真实 样本 
SENet 


FR-GAN 
term 


score + 


324-4 
std. 0.17 


2.95 


2.89 +0.02 
0.43 


3.02 0.14 


在 半 监 督学 习 方 面 ， 分 别 设 每 类 带 标签 的 样本 数 50. 


100， 带 标签 的 训练 样本 为 S00、1000。 如 表 3 所 示 ， 与 传统 


好 


一 | 
rH 


的 半 监 督学 习 算法 相 比 ， 除 文献 [3] 中 算法 ， 均 比 基 


他 算法 较 
; 文献 5 仅 针 对 单一 的 分 类 任务 , 分 类 性 能 较 好 , FR-GAN 


给 


使 


误 标 签 下 的 分 类 精度 变化 ， 随 着 比例 的 增加 ， 分 类 精度 下 降 


较 
精 
保 


在 图 像 分 类 任务 较 次 ， 但 其 损失 策略 能 够 帮助 其 在 图 像 生 
成 任务 比 常 规 GAN 较 好 。 


un 


当 使 用 所 有 标签 样本 进行 训练 时 ， 将 部 分 正确 标签 样本 
错误 标签 时 ， 所 提 模 型 能 够 减 小 分 类 精度 的 下 降 程 度 ， 


其 不 会 出 现 太 大 变化 ， 即 提高 网 络 的 容错 能 
如 图 4 所 示 ，(a) 表示 的 是 常规 GAN 在 一 定 比 例 的 错 


B^ (bo 表示 FR-GAN 在 一 定 比 例 的 错误 标签 下 的 分 类 
度 变 化 ， 可 以 看 出 ， 在 错误 标签 比例 占 50% 时 ， 精 度 基 本 


竺 在 一 定 范围 。 
表 3 SVHN 数据 集 测试 错误 率 对 比 结 


Table 3 SVHN data set test error rate comparison results 


测试 错误 率 〈%) # 标 签 数 


500 1000 
M1+M2!" - 36.02 + 0.10 
VAT“ - 24.63 
ADGMDI - 22.86 
SDGM"! - 16.61 + 024 
Improved-GAN"! 18.44 + 48 8.1 + 13 
ALIH - 7.42 + 0.65 
-modelP! 7.05 + 0.30 5.43 + 0.25 
Temporal ensemblingP"! 5.12 + 0.13 442 + 0.16 
FR-GAN with regular term 15.62 + 0.16 8.13 土 0.22 
FR-GAN 13.41 + 0.20 7.20 + 0.16 
4 ARA 
本 文 主要 针对 传统 鉴别 器 的 训练 模式 难以 提取 到 更 抽象 
的 和 任务 相关 的 鲁 棒 性 特征 ， 提 出 了 基于 特征 重 标定 的 生成 


对 抗 网 络 ， 为 了 学 习 到 任务 相关 的 特征 ， 为 鉴别 器 引入 模型 


在 
同 


不 同 状态 下 的 无 监督 特征 级 均 方差 损失 ， 对 真实 样本 中 的 
一 输入 得 到 的 不 同 输出 进行 惩罚 。 与 此 同时 ， 传 统 的 鉴别 


姜 代 红 ， 等 : 基于 特征 重 标定 生成 对 抗 网 络 的 图 像 分 类 算法 


器 的 结构 是 卷 积 加 池 化 模块 组 成 的 ， 本 文 在 鉴别 器 的 中 间 
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bil 


引入 SENet 模块 ， 自 动 学 习 每 一 个 特征 通道 的 重要 程度 ， 提 
取 任 务 相 关 有 用 的 特征 抑制 任务 无 关 的 特征 ， 从 而 提高 半 监 
督学 习 表 现 。 
HU. us 
1 "p hi 
DIE T ENN 
5o du Pn d 
证 50| r * RU 
© j j * S tl Š 
EN H "S P MURAT tl J 
| * BEAT t “i m t Wy 
ud Mord E 
| | i 
20 VM aa 一 -一 0% wrong labels. 
"i ben i Wind pe 
一 * 一 80% wrong labels 
0 L i — * — 9056 wrong labels 
0 50 100 150 200 250 300 
和 迭代 次 数 


(a) 常 规 GAN 的 精度 变化 


(a) Accuracy change of conventional GAN 


——-0% wrong labels 


É — 20% wrong labels 
-—- 50% wrong labels 

i 

104 —— 80% wrong labels 


—* - 90*6 wrong labels 


1 
50 100 150 200 250 300 
迭代 次 数 


(b)FR-GAN 的 精度 变化 
(b) FR-GAN accuracy variation 
错误 标签 下 的 分 类 精度 变化 对 比 


图 4 


Fig.4 Comparision of Classification Accuracy Rate in Wrong Labels 


Case 
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